Text copied to clipboard!

Titel

Text copied to clipboard!

Site Reliability Engineer (SRE)

Beskrivning

Text copied to clipboard!
Vi söker en Site Reliability Engineer (SRE) som vill vara med och säkerställa att våra system och tjänster är tillgängliga, skalbara och pålitliga. Rollen innebär att kombinera mjukvaruutveckling och systemadministration för att förbättra driftsäkerheten och automatisera processer. Du kommer att arbeta nära utvecklingsteam för att identifiera och lösa problem innan de påverkar användarna, samt implementera övervaknings- och varningssystem. Som SRE är du en nyckelperson i att bygga robusta infrastrukturlösningar och bidra till kontinuerlig förbättring av våra tekniska plattformar. Vi värdesätter en problemlösande inställning, teknisk expertis och förmågan att samarbeta tvärfunktionellt för att leverera högkvalitativa tjänster.

Ansvar

Text copied to clipboard!
  • Övervaka systemets hälsa och prestanda kontinuerligt.
  • Automatisera driftsprocesser för att minska manuellt arbete.
  • Felsöka och åtgärda systemfel snabbt och effektivt.
  • Samarbeta med utvecklingsteam för att förbättra applikationers tillförlitlighet.
  • Implementera och underhålla övervaknings- och varningssystem.
  • Analysera incidenter och föreslå förbättringar för att förebygga återkommande problem.
  • Delta i kapacitetsplanering och skalningsstrategier.
  • Dokumentera systemarkitektur och driftsprocedurer.
  • Utveckla och underhålla verktyg för infrastrukturhantering.
  • Stödja säkerhets- och efterlevnadsarbete relaterat till systemdrift.

Krav

Text copied to clipboard!
  • Erfarenhet av systemadministration och mjukvaruutveckling.
  • God kunskap i Linux/Unix-miljöer.
  • Erfarenhet av automatiseringsverktyg som Ansible, Puppet eller Terraform.
  • Kunskap om molntjänster som AWS, Azure eller Google Cloud.
  • Förståelse för nätverk och säkerhetsprinciper.
  • Erfarenhet av övervakningsverktyg som Prometheus, Grafana eller Nagios.
  • Förmåga att arbeta i agila team och hantera flera uppgifter samtidigt.
  • Starka problemlösnings- och kommunikationsfärdigheter.
  • Erfarenhet av containerteknologier som Docker och Kubernetes.
  • Kunskap om CI/CD-pipelines och versionshantering.

Potentiella intervjufrågor

Text copied to clipboard!
  • Hur hanterar du en kritisk incident i produktion?
  • Vilka automatiseringsverktyg har du erfarenhet av?
  • Hur säkerställer du systemets skalbarhet?
  • Kan du ge exempel på hur du förbättrat driftsäkerheten i tidigare roller?
  • Hur arbetar du med övervakning och larmhantering?
  • Vilka molnplattformar har du arbetat med?
  • Hur dokumenterar du system och processer?
  • Hur samarbetar du med utvecklingsteam för att lösa problem?
  • Vilka säkerhetsaspekter tar du hänsyn till i din roll?
  • Hur hanterar du stressiga situationer och prioriterar uppgifter?